专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果798149个,建议您升级VIP下载更多相关专利
  • [发明专利]基于多维度数据增强的强化方法及装置-CN202310382422.9在审
  • 暴宇健 - 北京龙智数科科技服务有限公司
  • 2023-04-11 - 2023-05-12 - G06T5/00
  • 本公开涉及机器学习技术领域,提供了一种基于多维度数据增强的强化方法及装置。该方法包括:获取训练数据集,并对训练数据集中的训练样本进行图像数据增强处理;将经过图像数据增强处理后的训练数据集中的训练样本作为强化中的状态输入到强化模型,利用强化模型对应的强化算法训练强化模型;在将训练样本输入到强化模型,以对强化模型进行训练的过程中:在强化模型内部处理训练样本得到样本向量后,对样本向量进行向量数据增强处理,以基于向量数据增强处理后的样本向量训练强化模型。采用上述技术手段,解决现有技术中,传统强化训练耗时以及训练的模型泛化性能差等问题。
  • 基于多维度数增强强化学习方法装置
  • [发明专利]强化训练方法及装置、电子设备、存储介质-CN202210153542.7在审
  • 金丹;唐思琦;李明强 - 中国电子科技集团公司信息科学研究院
  • 2022-02-18 - 2022-05-24 - G06N20/20
  • 本公开涉及强化技术领域,提供一种强化训练方法及装置、电子设备、存储介质,方法包括:基于源任务场景,对预设的强化模型进行训练,更新强化模型的网络参数,得到初始强化模型;分别确定初始强化模型中各个网络参数对于前一个任务场景的重要性,得到各个网络参数对应的第一重要性系数;基于根据第一重要性系数确定的损失函数,在预设的当前任务场景中对初始强化模型进行训练,更新初始强化模型的网络参数,得到目标强化模型。本公开能够约束网络参数的更新方向,不仅提高目标强化模型的泛化能力,还能使目标强化模型在不同的任务场景中均具有较好的性能表现,同时提高了强化模型的训练效率。
  • 强化学习训练方法装置电子设备存储介质
  • [发明专利]一种模型训练方法、装置、系统及可读存储介质-CN202211273736.7在审
  • 张凯 - 太保科技有限公司
  • 2022-10-18 - 2022-12-30 - G06Q10/10
  • 一种模型训练方法、装置、系统及可读存储介质,应用于强化技术领域。该方法包括:判断强化模型是否收敛;若强化模型不收敛,则随机选择一个软件环境并生成一个随机数;判断机数是否大于预设阈值;若否,则随机选取一条训练数据;对训练数据进行离线强化;若是,则对软件环境进行在线强化;完成强化后,再次判断强化模型是否收敛;若强化模型不收敛,则再次随机选择一个软件环境并生成一个随机数;若强化模型收敛,则结束训练。由此,本申请基于强化算法训练模型,使模型充分学习已知的容错知识,并在相类似错误发生时可以自动处理,大大提高流程容错性。
  • 一种模型训练方法装置系统可读存储介质
  • [发明专利]基于时空强化的跨模态视频时刻定位方法-CN202010562550.8在审
  • 曹达;曾雅文;荣辉桂;朱宁波;陈浩;秦拯 - 湖南大学
  • 2020-06-18 - 2020-10-16 - G06F16/732
  • 本发明提供了一种基于时空强化的跨模态视频时刻定位方法,包括以下步骤:S01、输入完整视频和查询语句,抽取视频特征和查询语句特征,构建强化环境;S02、基于强化环境信息进行时序强化并定位视频的时序边界,环境信息包括视频全局特征、视频局部特征、定位边界和查询语句特征;S03、基于时序强化的定位边界进行空间强化,在所述环境中处理空间信息并逐帧追踪相关场景,并用注意力机制过滤无关信息;S04、根据空间强化更新时序强化的局部片段特征,使得所述空间强化和所述时序强化交替训练,直至收敛,得到对应查询语句的视频时刻片段。
  • 基于时空强化学习跨模态视频时刻定位方法
  • [发明专利]基于TD3强化算法的DC-DC变换器控制方法-CN202310167190.5在审
  • 叶剑;郭寰宇 - 哈尔滨工业大学(深圳)
  • 2023-02-27 - 2023-06-23 - G05B13/04
  • 本发明公开了一种基于TD3强化算法的DC‑DC变换器控制方法,包括:基于DC‑DC变换器获取状态观测向量;基于TD3强化算法构建强化控制器模型,其中,所述强化控制模型包括强化智能体和奖励模块,将所述状态观测向量输入所述强化智能体,得到行为动作,并形成新状态观测向量;所述奖励模块基于所述行为动作得到即时奖励;基于所述即时奖励更新所述强化智能体的参数,直至收敛,得到训练好的强化控制器模型;基于所述训练好的强化控制器模型,实现对DC‑DC变换器的控制本发明可以有效提高变换器的动态响应性能。
  • 基于td3强化学习算法dc变换器控制方法
  • [发明专利]组件化的强化模型处理方法、系统、设备和存储介质-CN202110171433.3在审
  • 朱恒满;周正;张正生;刘永升 - 超参数科技(深圳)有限公司
  • 2021-02-07 - 2021-05-28 - G06N20/00
  • 本申请涉及一种组件化的强化模型处理方法、装置、计算机设备和存储介质。包括:获取虚拟对象在与交互环境进行交互过程中所产生的交互数据;虚拟对象是由部署于云端的强化系统中的运行组件所控制;强化系统还包括学习组件和评估组件;通过学习组件,基于交互数据对强化模型进行迭代训练;在迭代训练的过程中,通过评估组件对迭代训练所得的强化模型进行评估,根据评估所得的结果判断迭代训练所得的强化模型是否满足交互条件;若否,则根据迭代训练所得的强化模型对运行组件关联的模型进行更新,以使运行组件基于更新的强化模型控制虚拟对象。采用本方法能够降低在不同业务中复用强化模型训练框架的复杂度。
  • 组件强化学习模型处理方法系统设备存储介质
  • [发明专利]强化模型的训练方法及装置-CN202311168598.0在审
  • 杜梦雪;暴宇健 - 深圳须弥云图空间科技有限公司
  • 2023-09-12 - 2023-10-20 - G06N3/092
  • 本公开涉及计算机技术领域,提供了一种强化模型的训练方法及装置。该方法包括:获取使用设定强化算法对第一强化模型进行训练得到的第二强化模型;将相同的训练数据分别输入到第一强化模型和第二强化模型,对应得到第一输出数据组和第二输出数据组;根据训练数据、第一输出数据组、第二输出数据组和设定的总损失函数获取总损失函数值,其中,总损失函数的自蒸馏损失函数部分根据第一输出数据组和第二输出数据组的距离得到;根据总损失函数值调整第一强化模型,直到第一强化模型收敛,得到训练好的目标强化模型。本公开的技术方案可以提高强化模型在实际应用中的泛化能力和可复现性。
  • 强化学习模型训练方法装置
  • [发明专利]基于多智能体协作系统的深度强化方法和装置-CN202210715660.2有效
  • 丘腾海;付清旭;蒲志强;刘振;易建强 - 中国科学院自动化研究所
  • 2022-06-23 - 2022-09-27 - G06F30/27
  • 本发明提供一种基于多智能体协作系统的深度强化方法和装置,涉及人工智能技术领域,所述方法包括:在一次深度强化中,基于预先构建的深度强化网络和当前观测数据获取多智能体协作系统对应协作图的当前分配调整动作,基于当前分配调整动作获取当前奖惩数据,基于当前奖惩数据优化深度强化网络,重复执行上述步骤,直至达到预设收敛条件或者达到预设学习次数;通过多次深度强化更新协作图的当前分配调整动作,而不更新智能体的实际动作,以简化深度强化的步骤,实现在深度强化奖励稀疏的情况下,快速地进行多次深度强化积累更多的奖励,从而提高深度强化网络的训练效率以及收敛速度慢。
  • 基于智能体协系统深度强化学习方法装置
  • [发明专利]面向深度强化对抗攻击的模型增强防御方法-CN202010896464.0在审
  • 陈晋音;王雪柯;章燕 - 浙江工业大学
  • 2020-08-31 - 2020-12-11 - G06F21/57
  • 本发明公开了一种面向深度强化对抗攻击的模型增强防御方法,包括:(1)根据A3C模型,从自动驾驶场景中采集每个线程训练所需的样本数据;(2)针对每个线程构建由子Actor网络模型和子Critic网络模型组成的子强化模型,设定Actor损失函数和Critic损失函数;(3)针对每个线程对应的子强化模型,根据Actor损失函数对子Actor网络模型进行优化学;根据Critic损失函数对子Critic网络模型进行优化学;(4)利用子强化模型的参数更新A3C模型对应的主强化模型的参数,实现对主强化模型的训练,得到能够抵抗对抗攻击的主强化模型。
  • 面向深度强化学习对抗攻击模型增强防御方法
  • [发明专利]交易数据分析预测方法及装置-CN202111093221.4在审
  • 朴雪威;王丽静;杨春明;赵卉 - 中国银行股份有限公司
  • 2021-09-17 - 2021-12-17 - G06Q40/04
  • 本发明公开了一种交易数据分析预测方法及装置,涉及大数据技术领域,该方法包括:创建深度强化环境,定义有状态参数、行为参数和反馈参数;所述状态参数记录股票交易数据,所述行为参数记录股票交易行为,所述反馈参数记录由股票交易行为导致股票交易数据的变化;基于所述深度强化环境创建深度强化代理,定义有深度强化神经网络的模型结构和训练函数,以及根据模型输出选择的股票交易行为;利用所述深度强化代理构建深度强化神经网络,并对所述深度强化神经网络进行训练和测试,得到优化的深度强化神经网络;利用优化的深度强化神经网络对股票交易数据进行分析预测,提高股票交易数据分析预测的准确性。
  • 交易数据分析预测方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top